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Résumé - Abstract 



Nous présenterons dans cette communication les premiers travaux de modélisation informa- 
tique d'une grammaire de la langue créole martiniquaise, en nous inspirant des descriptions 
fonctionnelles de Damoiseau (1984) ainsi que du manuel de Pinalie & Bemabé (1999). Pre- 
nant appui sur des travaux antérieurs en génération de texte (Vaillant, 1997), nous utilisons un 
formalisme de grammaires d'unification, les grammaires d'adjonction d'arbres (TAG d'après 
l'acronyme anglais), ainsi qu'une modélisation de catégories lexicales fonctionnelles à base 
syntaxico-sémantique, pour mettre en œuvre une grammaire du créole martiniquais utilisable 
dans une maquette de système de génération automatique. L'un des intérêts principaux de ce 
système pourrait être son utilisation comme logiciel outil pour l'aide à l'apprentissage du créole 
en tant que langue seconde. 

In this article, some first éléments of a computational modelling of the grammar of the Marti- 
niquese French Créole dialect are presented. The sources of inspiration for the modelling is the 
functional description given by Damoiseau (1984), and Pinalie's & Bemabé's (1999) grammar 
manual. Based on earlier works in text génération (Vaillant, 1997), a unification grammar forma- 
lism, namely Tree Adjoining Grammars (TAG), and a modelling of lexical functional catégories 
based on syntactic and semantic properties, are used to implement a grammar of Martiniquese 
Créole which is used in a prototype of text génération System. One of the main applications of 
the System could be its use as a tool software supporting the task of leaming Créole as a second 
language. 
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Le créole martiniquais est l'un des représentants de la famille des langues créoles à base lexicale 
française de la zone Amérique-Caraïbes (« crelfacs »). Ces langues peuvent être décrites très 
généralement parmi celles qui se sont formées dans une situation de contact ; mais l'expres- 
sion relève ici d'un euphémisme considérable, le « contact » consistant en l'occurrence en la 
déportation massive de peuples de langues différentes, obligés d'adopter en peu de temps un 
véhiculaire comme nouveau moyen d'expression. La situation historique évoquée est celle de 
la colonisation du Nouveau Monde par les puissances européennes entre le XVIIe et le XIXe 
siècle, et de l'importation massive et forcée de main d' œuvre africaine engendrée par le système 
économique esclavagiste. 

Les créoles ont ainsi subi simultanément, en l'espace d'à peine quelques générations, plusieurs 
processus d'évolution diachronique rapides (AUeyne, 1996). Certains sont assez faciles à se 
représenter et sont l'objet d'une description relativement classique : ce sont par exemple les 
développements de tournures analytiques, du même type que ceux qui ont conduit du latin au 
langues romanes modernes, et qui sont encore à l'œuvre dans le français actuel (plus dévelop- 
pées dans les variétés de français populaire qui étaient parlées par les colons que dans la langue 
standard, ces tournures auraient ainsi pu selon Chaudenson (1995) contribuer directement à in- 
fluencer le lexique et la grammaire créole). D'autres, beaucoup plus spécifiques à la situation 
et beaucoup moins à la portée de l'investigation linguistique historique, ont pu provoquer des 
amalgames de structures lexicales et syntaxiques françaises d'une part, et de structures prove- 
nant de plusieurs langues africaines d'autre part, la propagation de modèles linguistiques variant 
dans certains cas avec l'influence de certains groupes de peuplement, qui jouissaient à certaines 
époques de situations de domination démographique ou culturelle relative (AUeyne, 1996). Les 
créoles ont en fin de compte développé un système sémantique et un système syntaxique tout à 
fait original, tout en gardant incontestablement une base lexicale majoritairement française. 

Ces considérations historiques ne sont pas l'objet du travail présenté ici, mais leur rappel permet 
de resituer dans leur perspective les caractères originaux des crelfacs. 

Dans une perspective synchronique, quoi qu'il en soit, nous nous sommes attachés à mettre 
sur pied une modélisation adéquate et économique des descriptions linguistiques du système 
actuel de la langue. Nous nous sommes appuyés, pour le cœur de la description des énoncés, 
sur l'approche fonctionnelle de Damoiseau (1984), tout en ayant recours pour des descriptions 
plus fines à certains exemples de (Bernabé, 1983) et de (Pinalie & Bemabé, 1999). 

Le créole martiniquais est l'un des représentants de la famille des crelfacs, avec le guyanais, 
le trinidadien (en voie d'extinction, au profit de l'anglais), le saint-lucien, les dialectes domi- 
nicais, les dialectes guadeloupéens, les dialectes haïtiens, et le louisianais. Il a la particularité 
d'être l'un des plus unifiés, et partage par ailleurs avec le créole de Port-au-Prince (devenu 
langue nationale d'Haïti) une richesse en termes de production culturelle qui ne se retrouve 
qu'à un degré moindre dans d'autres pays créolophones. L'approche présentée ici est cependant 
aisément transposable à d'autres langues du même groupe, notamment le guadeloupéen et le 
guyanais. 
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2 Description 

Nous exposons ici quelques faits grammaticaux succints ; des descriptions plus complètes des 
faits de grammaire du créole martiniquais se trouvent dans les ouvrages déjà cités (Damoiseau, 
1984; Bernabé, 1983; Pinalie & Bernabé, 1999). 

Le créole est une langue isolante, dans laquelle les éléments lexicaux sont invariables. Les 
fonctions syntaxiques sont toutes manifestées par l'ordre des éléments dans la phrase. 

Groupes verbaux 

L'absence de flexion nominale est déjà familière à un lecteur francophone. Comme le français, et 
contrairement aux langues à flexion nominale comme le latin ou le russe, le créole ne détermine 
la fonction des actants et des circonstants des verbes que par deux procédés : (a) leur position 
dans la chaîne syntaxique, et (b) des prépositions introduisant des cas sémantiques spécifiques. 
L'ordre des actants et des circonstants a tendance a être plus rigide encore qu'en français, le 
procédé (a) ayant un périmètre d'emploi plus étendu encore. Ainsi, en créole, les verbes triva- 
lents de type « attributif » (correspondant à des verbes français comme donner, prêter, montrer, 
etc.) forment des phrases à l'aide d'un cadre de distribution syntaxique des actants qui comporte 
trois groupes nominaux directs, là où en français seuls le sujet et l'objet sont des groupes directs 
(le complément d'attribution étant introduit par la préposition à ). Ceci impose un ordre strict, 
en l'occurrence S V A O, pour déterminer les actants. Ainsi, en français les phrases (la) et (Ib) 
sont toutes deux recevables, alors qu'en créole seule la phrase (2b) est recevable. 

(la) Pierre a donné un beau livre à Robert 
(Ib) Pierre a donné à Robert un beau livre 

(2a) *Pyè ba an bel liv Wobè 
(2b) Pyè ba Wobè an bel liv 

La flexion verbale est ici remplacée par un système d'expression des variations d'aspect et de 
temps qui est purement analytique, comme celui que l'on observe en chinois. Les différents 
degrés sont exprimés par des particules temporelles ou aspectuelles qui sont préposées au verbe 
(contrairement au chinois, où elles sont postposées). 

Le nombre de marques possibles du temps et de l'aspect est limité; la gamme d'emplois de 
chacune de ces marques est donc vaste. Cet état de choses fait de leur description sémasiolo- 
gique une tâche considérable, et il est difficile de caractériser le système de manière simple. Un 
panorama complet de cette question, ainsi qu'une description plus particulière des différences 
entre créole guyanais et martiniquais, est présenté par (Pfànder, 2000). 

Plusieurs descriptions systémiques ont été proposées ; nous retiendrons pour l'état actuel de 
notre modélisation celle de Damoiseau (1984, p. 26). Si l'on peut questionner la pertinence de 

la frontière stricte qu'il trace entre marques temporelles et marques aspectuelles, notamment 
au sujet de la classification de ké comme marque strictement aspectuelle, son système présente 
l'avantage de recouper en assez grande partie la combinatoire syntagmatique de ces marques : 



TEMPS : 


ASPECT : 




perfectif 


imperfectif 
(duratif, général, itératif) 


imperfectif 
(prospectif) 


(pas d'indication) 





ka 


ké 


passé 


té 


té ka 


té ké 
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Les combinaisons 0, ka, ké, té, té ka et té ké sont en effet les plus fréquemment attestées . 

Pour donner une idée des valeurs de ces combinaisons de marques, on peut mentionner certaines 
de leurs traductions les plus fréquentes en français : mwen domi ; j'ai dormi ; mwen ka domi : 
je dors ; mwen ké ddmi : je vais dormir; mwen té ddmi : j'avais dormi; mwen té ka ddmi : 
je dormais ; mwen té ké ddmi : j'aurais dormi. Il faut cependant bien entendu garder à l'esprit 
qu'il ne s'agit pas d'équivalences systématiques, puisque les systèmes aspecto-temporels ne se 
recoupent pas, et que la notion de « mode » est étrangère au créole. 

En première approche, on peut schématiser les domaines d'application des systèmes aspectuel 
et temporel en disant que la caractérisation de l'aspect (0, ka ou ké) ne porte que sur des verbes 
exprimant un procès, alors que la caractérisation du temps (0 ou té) s'applique aussi bien aux 
procès qu'aux états. On a donc deux séries de verbes, celle qui peut suivre les marques 0, ka, ké, 
té, té ka et té ké, et celle qui ne peut suivre que ou té. C'est en ces deux séries de verbes, par 
exemple, que (Saint-Quentin, 1989), l'une des premières grammaires créoles, voulait distinguer 
deux « conjugaisons » du créole guyanais. 

Selon cette description, les phrases (3a) et (3b) sont donc possibles et leur différence traduit une 
nuance d'aspect, alors que seule la phrase (4a) est recevable. 

(3a) / ddmi tout lajounen (il a dormi toute la journée) 

(3b) / ka domi tout lajounen (il passe ses journées à dormir) 

(4a) / ni anpil lajan (il a beaucoup d'argent) 
(4b) */ ka ni anpil lajan 

Cette description est en réalité une simplification, puisqu'il existe bel et bien des contextes 
dans lesquels l'application de marques aspectuelles à des verbes « à signifié non-processif » 
(Damoiseau, 1984) est attestée : ravèt pa ka ni rézon douvan poul (le ravet n'a jamais raison 
devant la poule) ; ou même : là i ka soti kazino i ka ni anpil lajan : à chaque fois qu'il sort du 
casino, il a plein d'argent. Nous nous en tiendrons cependant à la première approche dans le 
cadre de ces premières tentatives de modélisation. 

Groupes nominaux 

Les groupes nominaux du créole ont un système de degrés de détermination qui comprend un 
degré générique, exprimé par (ainsi ravèt et poul dans l'exemple ci-dessus), un degré in- 
déterminé {an timanmay : un enfant), un degré défini exprimé par un déterminant postposé 
(timanmay-la : l'enfant), et un degré démonstratif également exprimé par un déterminant post- 
posé (timanmay-tala : cet enfant). Les déterminants postposés, en martiniquais, peuvent se com- 
biner avec une marque préposée sé- pour former un pluriel défini (sé-timanmay-tala : ces en- 
fants) — le pluriel générique du français n'ayant pas d'équivalent : on utilise le degré générique 
du singulier. 

Il n'existe pas de genre grammatical ; en revanche les noms déterminent une variation dans le 
choix de l'article défini, selon un principe d'harmonie consonantique et nasale : les mots se 
terminant par une voyelle ouverte prennent la marque -a comme déterminant défini, les mots se 



Les choses sont plus complexes en réalité, puisque la combinaison ké ka est également attestée avec une valeur 
de futur duratif — cf. (Pinalie & Bernabé, 1999, p. 77) : lè ou ké rivé, nou ké ka domi : quand vous arriverez, nous 
serons en train de dormir. La combinaison té ké ka est même possible (comme dans la chanson de zouk : « Kolé 
séré nou té ké ka dansé » ~ nous serions en train de danser l'un contre l'autre). Valdman (1978, p. 219) expose 
un système plus complet fondé sur deux catégories d'aspect (icontinuatif, iprospectif), et une catégorie de temps 
(zbpassé). 
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terminant par une consonne ou par une semi-voyelle (y ou w ) prennent la marque -la. Ceci ne 
s'applique qu'aux mots dont la dernière syllabe est non-nasalisée ; Pour les mots à terminaison 
nasale, les marques du défini sont respectivement -an et -lan. 

Parties du discours 

L'un des faits les plus frappants du créole, enfin, est l'absence de frontières nettes de catégories 
grammaticale. La tentation de rapprocher les mots d'origine française de leurs étymons et de 
leur attribuer la même catégorie (nom, verbe, adjectif ...) est souvent grande, et elle a même as- 
sez fréquemment une certaine pertinence, mais cette analogie est trompeuse. Dans beaucoup de 
cas en effet, si un mot peut être utilisé dans le même emploi grammatical que son étymon fran- 
çais, il possède également d'autres emplois, propres à des catégories syntaxiques différentes. 

Les adjectifs, par exemple, ont en français besoin d'un verbe copule pour figurer en fonction 
d'attribut : le gros arbre vs. l'arbre est gros. En créole, l'adjectif seul peut jouer le rôle de pré- 
dicat : gwo pyébwa-a vs. pyébwa-a gwo (cf. chinois dà shùmù vs. shùmù dà). L'adjectif dans 
cette position de prédicat-attribut peut également recevoir les marques temporelles de la même 
manière que les verbes d'état : pyébwa-tala té gwo : cet arbre était gros ; voire des marques 
aspectuelles dans certains contextes, comme les verbes d'état également (exemple cité par Da- 
moiseau (1984, p. 29) : / ka las vit : il se fatigue vite). Il est en fait très difficile de fournir une 
définition permettant de distinguer le verbe en tant que catégorie distincte de l'adjectif autre- 
ment que par des critères négatifs (blocage de la fonction épithète). 

Au-delà du cas des verbo-adjectivaux, des « noms » peuvent apparaître en position de prédicat (/ 
yich mwen : c'est mon enfant), et des « verbes » en fonction nominale (mwen domi an bel domi : 
j'ai sacrément dormi [litt. j'ai dormi un grand dormir] ; vin pran an bwè : viens prendre un verre 
[litt. viens prendre un boire]) ; et ces tournures sont loin d'être des exceptions ou des figures de 
style, mais font partie du fonctionnement le plus banal de la langue. Certains verbes, en outre, 
occupent des fonctions de préposition. Ainsi, le verbe ba (donner), qui construit généralement 
des phrases avec trois actants (i ba mwen an pen : il m'a donné un pain), peut, accompagné du 
seul actant destinataire, construire un syntagme qui joue le rôle de circonstant pour les verbes 
n'ayant pas le destinataire dans leur cadre valenciel de base. Ainsi dans ipdté an boutèy wonm 
ba mwen : il m'a apporté une bouteille de rhum, ou mwen ka palé ba'w : je suis en train de 
te parler (cf. chinois tâ gëi wô yi ping jiû : il me donne une bouteille d'alcool, vs. ta dàilâi le 
yi ping jiû gei wô, il m'a apporté une bouteille d'alcool). Certains verbes enfin peuvent être 
employés comme particules aspectuelles, enrichissant le système fondé sur {0, ka, ké et té} ; 
ainsi sàti (sortir) ou fini (finir) dans des tournures comme : es ou kompwann sa yo sàti di 'w 
la ? : est-ce que tu comprends ce qu'ils viennent de te dire ? (Bemabé, 1983, p. 1057), ou pwan 
(prendre) dans : ipwan kouri : il s'est mis à courir (Bemabé, 1983, p. 1043). 



3 Modélisation 

On pourrait donner encore d'innombrables exemples de cette plasticité grammaticale ; la leçon 
qu'il convient d'en tirer dans le cadre de ce travail (modélisation informatique), est qu'il faut 
développer un mécanisme pour la prendre en compte, car elle est tout sauf marginale. 

Il serait peu pratique de multiplier les catégories grammaticales ad hoc en faisant un pro- 
duit cartésien sur les catégories de la grammaire française pour obtenir des parties du dis- 
cours sur-spécialisées (adjectif-verbe-qui-ne-peut-jamais-être-un-nom, ou nom-pouvant-servir- 
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parfois-de-verbe-d'état ...)• Il nous paraît également qu'il serait assez artificiel de prévoir un 
grand nombre de règles de conversion ; il semble en définitive que la catégorie grammaticale 
soit une notion moins essentielle en créole martiniquais qu'en français, ou autrement dit — car 
il faut bien tout de même des fonctions dans l'énoncé — qu'elle soit plus qu'ailleurs contextua- 
lisable. Le fait qu'un mot ait la possibilité de remplir une fonction de sujet (comme un groupe 
nominal), d'épithète (comme un adjectif), de prédicat (comme un verbe) ... semble pouvoir être 
déterminé de manière afférente aussi bien qu'inhérente, pour reprendre ici le vocabulaire de 
Rastier (1987). Un mot peut avoir un emploi central de verbe, mais, placé dans un contexte de 
groupe nominal (avec un article, par exemple), pouvoir être interprété sans difficulté comme 
un nom. De même, un nom, placé directement après le sujet, et éventuellement temporalisé 
par une particule comme té, peut jouer le rôle d'un verbe si son sens s'y prête. Ces réflexions 
sont d'ailleurs probablement valides en principe pour toutes les langues^, quoiqu'à des degrés 
variables. 

Il a donc été choisi de ne retenir que deux grandes catégories grammaticales (N et Pred : nom et 
prédicat), lesquelles peuvent être déterminées plus spécifiquement par des ensembles de traits 
caractérisant leurs emplois possibles : 

Pred possède les attributs <type>=T, <cadre>=C, <±epithete>. Le type T classe le 
mot soit parmi les verbes exprimant un procès {domi : dormir, manjé : manger, ba : donner, 
pdté : porter, etc.), soit parmi les verbes ou les verbo-adjectivaux exprimant un état (ni : avoir, 
sav : savoir, gwo : gros/être gros, las : fatigué/être fatigué, etc.). Le cadre C correspond au 
cadre d'attribution de positions syntaxiques aux actants du verbe (sous-catégorisation verbale) : 
intransitif pour ddmi ou las, transitif pour manjé, attributif pour ba, etc. Le trait épithète, à 
valeur binaire, détermine si le mot peut oui ou non apparaître en position épithète, comme un 
adjectif : il est positif pour gwo et négatif pour manjé, par exemple. 

N possède l'attribut <harm>=A, qui détermine le type de marque de détermination définie qui 
doit apparaître selon la syllabe finale (A peut valoir a, la, an ou lan ). Les noms propres et les 
pronoms personnels possèdent également le trait <det>=def , qui exprime le fait qu'ils sont 
déjà définis (et ne se combinent donc plus avec un déterminant) — le trait <det> n'apparais- 
sant dans les autres cas qu'au niveau de barre 2, c'est-à-dire au niveau du groupe nominal. Le 
fait qu'un N puisse oui ou non apparaître également en fonction verbale est déterminé par la pré- 
sence, à côté de ces traits spécifiquement nominaux, du trait <cadre>=C signalant l'existence 
d'une valence interne. 

Cette conception des catégories comme faisceaux de traits évoque celle qui guide le formalisme 
des grammaires syntagmatiques généralisées (GPSG) (Abeillé, 1993, p. 101-105). Nous avons 
toutefois préféré utiliser pour ce travail le formalisme des grammaires d'arbres adjoints à uni- 
fication de structures de traits (FS-TAG) (Vijay-Shanker & Joshi, 1988), (Abeillé, 1993, ch. 4), 
qui se prête tout à fait bien à la génération (bien qu'il ait d'abord été conçu pour l'analyse) grâce 
à sa capacité à représenter les tours de phrase sous la forme d'arbres élémentaires s' étendant sur 
plus d'un seul niveau. L'utilisation de modèles d'arbres adjoints pour la génération a été pour 
cette raison adoptée dans différents travaux de recherche, d'autant qu'elle a pu être étendue 
au-delà du niveau de la phrase, comme dans le modèle G-TAG (Danlos, 1998). 

Nous n'avons en revanche pas, pour cette application de génération, une grammaire TAG en- 
tièrement lexicalisée ; les arbres sans ancre lexicale nous permettent en effet de donner une 



^Ainsi, un énoncé comme je mère-poule mes enfants est tout à fait compréhensible — sinon recevable — en 
français (exemple emprunté à Jacques Coursil). 
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description formelle homogène à des structures parallèles, dont les unes s'expriment avec une 
marque lexicale et les autres avec une marque zéro (ex. imperfectif en ka vs. perfectif en 0). En 
outre, les arbres sans ancre lexicale permettent (a) de faire l'économie de quelques kilo-octets 
de fichier, et de nombreuses opérations de copie-colle, en regroupant sous un même « arbre 
schéma » toutes les structures verbales ayant le même cadre de sous-catégorisation ; (b) de 
rendre compte des phénomènes linguistiques de degré de complexité supérieur à la phrase nu- 
cléaire (comme les subordonnées relatives) (Abeillé, 1993, p. 230). 

Construction du GN 

Le N non encore défini, mais qui peut avoir déjà reçu des compléments (en termes de théorie de 
X-barre, le N), se substitue à la position adéquate dans l'arbre élémentaire du déterminant pour 
former le GN (niveau de barre 2). Le cas du déterminant indéfini est illustré fig. la (la valeur du 
trait harm. A, est une variable), et un exemple de déterminant défini est illustré fig. Ib^. 

gn <det> = ind gn <det> = def 

gn <det> = Degré 
n \^ <det> = Degré 

Fig. 1 - Arbres élémentaires : (a) du déterminant indéfini ; (b) d'un déterminant défini ; (c) du 
degré de détermination générique ; (d) du nom déjà défini. 



det 



an 



n 



i 



<harm> 
<det> = 



n ^ <hann> = la det 
<det> = — 

la 



gw <det> = gen 



n I <det> = 



Cette modélisation place le déterminant défini postposé après les éventuels compléments, comme 
les compléments de nom, ou les subordonnées relatives. Ceci est conforme avec l'usage du 
créole martiniquais, qui dit : kay-la (la maison) ; kay papa mwen an (la maison de mon père) ; 
kay mwen ja palé ba'w la (la maison dont je t'ai parlé). 

Le GN déterminé au degré générique se construit à partir du nom non encore déterminé grâce à 
l'arbre représenté en fig. le ; tandis que le GN peut également se constituer directement sur la 
base d'un N pré-déterminé au niveau lexical, comme un pronom personnel ou un nom propre, 
comme illustré fig. Id. 

Construction du GPred 

Le prédicat connaît trois niveaux d'expansion, conformément au choix que nous avons fait de 
nous conformer au modèle simplifié du temps et de l'aspect présenté par Damoiseau (1984) (cf. 
plus haut). 

Au niveau lexical, le Pred n'est marqué ni en temps ni en aspect. Au niveau 1, il est marqué en 
aspect : soit avec une valeur d'aspect zéro, dans le cas où il s'agit d'un état ; soit avec une valeur 

d'aspect perfectif, imperfectif ou prospectif, s'il s'agit d'un procès. Les arbres correspondant à 
l'aspect zéro (pour un état), et à l'aspect perfectif (pour un procès), sont montrés respectivement 
en fig. 2a et fig. 2b. Les aspects imperfectif et prospectif sont formés à l'aide des marques ka et 
ké. L'arbre correspondant au cas de l'aspect imperfectif est montré en fig. 2c. L'aspect prospectif 
se construit de la même manière. 

^N.B. Dans ces figures, comme dans les suivantes, conformément à la tradition héritée du langage Prolog et du 

formalisme des grammaires à clauses définies (DCG), les termes commençant par une majuscule correspondent à 
des variables, alors que les termes commençant par des minuscules correspondent à des valeurs instanciées. 
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pred <asp> = zéro 

<cadre> = Cadre 



<type> = état 
pred l, <cadre> = Cadre 
<asp> = — 



pred <asp> = perf 

<cadre> = Cadre 



<type> = proc 
pred \, <cadre> = Cadre 
<asp> = — 



<asp> = imperf 
P^^o <cadre> = Cadre 



ma 



ka 



pred 



<tjfpe> = proc 
<cadre> = Cadre 
<asp> = — 



FiG. 2 - Arbres de construction du prédicat : (a) aspect zéro ; (b) aspect perfectif ; (c) aspect 
imperfectif. 



Au niveau 2, le prédicat est marqué en temps, soit avec la marque zéro (0), soit avec la marque 
du passé (té) ; les mécanismes utilisés correspondent respectivement, à un niveau d'expansion 
au-dessus, à ceux utilisés pour marquer respectivement l'aspect perfectif ou l'aspect imperfec- 
tif sur les prédicats-procès. La marque de temps s'applique à un terme de niveau 1 (Pred) qui 
peut donc être soit un état (automatiquement à l'aspect zéro), soit un procès (déjà marqué en 
aspect). Dans l'arbre élémentaire servant à passer du prédicat marqué en aspect (Pred) au pré- 
dicat marqué en temps et en aspect (Pred), le nœud inférieur (nœud de substitution) doit donc 
spécifier la présence du trait aspect et l'absence du trait temps, puis reporter le trait aspect au 
niveau supérieur, et y ajouter le trait temps — le nœud supérieur comportant donc en tout les 
traits temps, aspect et cadre. 

Enfin, au niveau supérieur, GPred, le prédicat marqué en temps et en aspect (Pred) est entouré 
de ses actants, dans la disposition spécifique du cadre de sous-catégorisation concerné. Le trait 
cadre est supprimé, et un trait saturé est ajouté. La phrase nucléaire (Ph) est constituée d'un 
sujet et d'un GPred saturé. 

Les différents cadres de sous-catégorisation sont représentés par des arbres-schéma (fig. 3), qui 
engendrent des familles d'arbre lorsque l'on y greffe les arbres des différents prédicats marqués 
en temps et en aspect. 



<asp> = Aspect 
pjl <tem> = Temps 



<sature> = + 



[sujet] 

<asp> = Aspect 
<tem> = Temps 
<cadre> = intrans 



gpred 



pred i 
[prédicat] 




[sujet] 



gpred 



: <asp> = Aspect 
' : <tem> = Temps 
■ <sature> = + 



pred l 

[prédicat] 



<asp> = Aspect 
<tem> = Temps 
<cadre> = attrib 




[destinataire] 



[objet] 



FiG. 3 - Arbres schéma : (a) des verbes intransitifs ; (b) des verbes attributifs. 



Les circonstants, c'est-à-dire les rôles sémantiques qui n'ont pas pu être exprimés par les actants 
du cadre valenciel de base du verbe, sont exprimés par l'adjonction de syntagmes préposition- 
nels. Comme dans le cas déjà évoqué des compléments d'attribution introduits par ba, le rôle 

des prépositions peut parfois être joué par des verbes accompagnés d'un jeu « restreint » d' ac- 
tants. Ces types de syntagmes sont modélisés comme des GPred, à la différence que le verbe 
y est utilisé avec un autre cadre de sous-catégorisation ; le cas est donc traité comme une alter- 
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nance verbale. Ainsi, le verbe ba possède, à côté de son cadre « complet » (attributif), un cadre 
« restreint » (prep_datif) qui est utilisé pour former les arbres auxiliaires pour l'adjonction de 
compléments d'attribution, grâce à l'arbre- schéma représenté fig. 4. Un trait saturé, contrai- 
gnant l'adjonction sur le nœud pied de ce type d'arbres, garantit que les circonstants ne peuvent 
commencer à s'adjoindre au GPrep qu'après tous les actants (sujet excepté). 



<cadre> = prep_datif 
<sature> = + 

gpred 

<sature> = + 



pred gn | 

<cadre> = prep_datif [destinataire] 

ba 

FiG. 4 - Arbre auxiliaire pour exprimer les compléments d'attribution. 




4 Mécanisme de génération 

Le programme réalisé implante informatiquement les arbres décrits par des structures PROLOG. 
Toutes les opérations élémentaires sur les structures de traits (unification, écrasement) ont été 
également implantées sous la forme de buts PROLOG, ainsi que les opérations sur les arbres 
spécifiques au modèle TAG (substitution et adjonction). 

La structure de départ du processus de génération est un graphe conceptuel contenant des nœuds 
liés entre eux par des rôles sémantiques. Les nœuds peuvent porter des attributs sémantiques qui 
servent à en préciser la valeur (temps, aspect, degré de détermination ...) Le programme effec- 
tue la génération en parcourant le graphe conceptuel en un parcours direct (arbre de couverture 
du graphe), et en engendrant, pour chaque prédicat, un arbre correspondant à la verbalisation 
de ce prédicat et de ses actants fondamentaux sous la forme d'une phrase nucléaire. Les rôles 
sémantiques non- verbalisés dans la phrase nucléaire sont ensuite générés sous forme d'arbres 
auxiliaires à tête GPred, et adjoints à la phrase nucléaire. Enfin, les relations sémantiques inci- 
dentes à l'un des concepts de l'arbre de couverture direct, mais non encore exprimées dans la 
phrase principale, sont soit adjointes lorsque c'est possible par un procédé syntaxique commun 
(épithète, subordonnée relative), soit générées dans de nouvelles phrases juxtaposées à celles 
déjà engendrées. Ce mécanisme a été exposé plus en détail dans (Vaillant, 1997; Vaillant, 1998), 
et reste fondamentalement le même, indépendamment de la langue à laquelle il est appliqué. 



5 Conclusion 

Dans ce travail, une grammaire à adjonction d'arbres a été utilisée pour passer d'une structure 
sémantique limitée au niveau phrastique à une lexicalisation en langue créole. Nous n'avons 

pas eu l'ambition en revanche d'essayer de partir d'une structure sémantique « interlangue » ou 
« indépendante de la langue ». Le système des paramètres sémantiques utilisés pour le temps et 
l'aspect, par exemple, est ni plus ni moins celui de la langue créole martiniquaise (ou tout ou 
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moins du sous-ensemble que nous prétendons en modéliser). La question de l'existence d'une 
étape encore antérieure à la représentation liée à la structure sémantique de la langue-cible n'est 
pas abordée dans le cadre de cette étude, qui se borne à réaliser la génération de la chaîne 
syntagmatique à partir d'un modèle du sens dans la même langue, représenté sous forme de 
graphe. Tout au plus peut-on noter que le même système peut servir, à quelques modifications de 
la grammaire près, pour des dialectes proches, qui ont à peu près le même système sémantique 
(ainsi le guadeloupéen, ou le guyanais de la côte). 

La question de l'étape antérieure se pose en réalité dans deux contextes : soit dans les tentatives 
de modélisation des processus cognitifs fondamentaux, qui postulent l'existence d'une hypothé- 
tique représentation sémantique profonde, ou universelle ; soit dans les applications de transfert 
d'un système sémiotique à un autre, donc de génération de phrases créoles, par exemple, à 
partir d'une entrée qui pourrait aussi bien être formulée en français, en allemand, en chinois, 
ou en idéogrammes Bliss. Nous viendrons à l'avenir à nous pencher sur le second problème, 
qui pourra être le noyau d'un futur système d'aide à l'apprentissage, destiné par exemple à des 
apprenants n'ayant pas le créole pour langue maternelle. Quant au premier problème, il nous 
semble hors de notre portée. On pourra se consoler en évoquant l'hypothèse du créoliste in- 
néiste Bickerton (1981), selon lequel ressurgissent dans les langues créoles les structures innées 
du langage faisant partie du « bioprogramme » de l'humanité. Selon cette hypothèse, donc, s'il 
existe une quelconque structure sémantique universelle, c'est précisément celle que nous avons 
sous la main avec le créole ... 



Références 

AbeillÉ a. (1993). Les nouvelles syntaxes. Paris: Armand Colin. 

Alleyne m. (1996). Syntaxe historique créole. Hommes et sociétés. Paris: Karthala. 

BernabÉ J. (1983). Fondal-natal. Paris: L'Harmattan. 3 vols. 

Bickerton D. (1981). Roots oflanguage. Ann Arbor (É.-U.-A.): Karoma. 

Chaudenson R. (1995). Les Créoles. Que sais-je ? Paris: PUF. 

Damoiseau R. (1984). Éléments de grammaire du créole martiniquais. Fort-de-France: Hatier An- 
tilles. 

Danlos L. (1998). G-TAG : un formalisme lexicalisé pour la génération de textes inspiré de TAG. 

Traitement Automatique des Langues — T.A.L., 39(2), 4-32. 

Pfànder s. (2000). Aspekt und Tempus im Frankokreol. ScriptOralia. Tubingen: Gunter Narr. 
PiNALlE P. & BernabÉ J. (1999). Grammaire du créole martiniquais. Paris: L'Harmattan. 
Rastier F. (1987). Sémantique Interprétative. Formes Sémiotiques. Paris: PUF. 
Saint-Quentin A. d. (1989). Étude sur la grammaire créole. In Introduction à l'histoire de Cayenne, 
suivie d'un recueil de contes, fables et chansons en créole, Cayenne: Comité de la Culture, de l'Éducation 
et de l'Environnement de Guyane. Première édition 1872. 

Vaillant P. (1997). Interaction entre modalités sémiotiques. De l'icône à la langue. Orsay: Université 
Paris-Sud. Thèse de doctorat. 

Vaillant P. (1998). Interprétation of iconic utterances based on contents représentation: Semantic 

analysis in the PVI System. Natural Language Engineering, 4(1), 17-40. 

Valdman a. (1978). Le créole : structure, statut et origine. Paris: Klincksieck. 

Vijay-Shanker K. & JOSHI A. (1988). Feature-structure based Tree Adjoining Grammars. In Procee- 

dings of the 12^^ International Conférence on Computational Linguistics (COLING 1988), p. 714-719, 

Budapest (Hongrie). 



